استخراج ویژگی های زمانی- فرکانسی از سیگنال های گفتار فارسی جهت بهبود کارایی یک سیستم vad برای ارتباط انسان و ربات
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
- author فهیمه جمهوری
- adviser حسین مروی علیرضا احمدی فرد
- Number of pages: First 15 pages
- publication year 1393
abstract
استفاده از ربات های اجتماعی در زندگی انسان ها افزایش یافته است و اصلی ترین راه ارتباط انسان ها با آنها ارتباط کلامی است. ربات های اجتماعی دارای میکروفونی هستند تا بتوانند سیگنال گفتار را برای ارتباط با انسان دریافت کنند. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص قسمت های گفتار در سیگنال های صوتی ضبط شده می باشد. هدف این پایان نامه طراحی یک سیستم آشکارساز فعالیت گفتاری است که بتواند با مشخص نمودن بخش های گفتار در یک محیط نویزی کارایی یک سیستم پردازش گفتار مورد استفاده برای یک ربات اجتماعی را افزایش دهد. در این پایان نامه، ویژگی های مختلفی جهت استخراج از سیگنال گفتار برای سیستم آشکارساز فعالیت گفتاری پیشنهاد شده است. این ویژگی ها با استفاده از ترکیب ویژگی انرژی با هر یک از ویژگی های ضرایب کپسترال فرکانس مل ریشه، ضرایب کپسترال فرکانس بارک، ضرایب پیش بینی ادراکی خطی و ضرایب پیش بینی ادراکی خطی تجدید نظر شده ارائه شده اند. روش پیشنهادی دیگری که در این پایان نامه مطرح شده بر مبنای ویژگی ویگنر ویل به عنوان یک روش استخراج ویژگی زمانی-فرکانسی است. این روش در مقایسه با روش های پیشنهادی مبتنی بر ویژگی انرژی و ویژگی های کپسترال، کارایی بهتری دارد. بنابراین برای افزایش کارایی روش های مبتنی بر ویژگی های کپسترال علاوه بر ویژگی انرژی، با ویژگی ویگنر ویل نیز ترکیب شده اند. برای ارزیابی کارایی روش های پیشنهادی، دادگان گفتاری فارس دات که یک پایگاه داده استاندارد و به زبان فارسی می باشد، به کار رفته است. با افزودن چند نوع متفاوت نویز به فایل های این پایگاه داده در شرایط مختلف نسبت سیگنال به نویز، مقاومت روش های پیشنهادی نسبت به نویزهای متفاوت سنجیده شده اند. آزمایشات نشان داده اند که برخی از روش های استخراج ویژگی پیشنهادی در این پایان نامه در مقایسه با روش متداول استخراج ویژگی ضرایب کپسترال فرکانس مل در محیطهای نویزی کارایی بهتری دارند.
similar resources
حذف خودکار آرتیفکت چشمی از سیگنال های مغزی با استفاده از ویژگی های آماری و زمانی- فرکانسی مولفه های مستقل
مهمترین مشکل در بررسی و پردازش ثبت های الکتروآنسفالوگرام (EEG) حضور انواع سیگنال های ناخواسته (آرتیفکت ها) است که حذف آنها با روش تحلیل مولفه های مستقل از بهترین گزینه های ممکن است. هدف مساله تحلیل مولفه های مستقل جداسازی کور ترکیبی خطی از منابع مستقل است. با اعمال این روش روی سیگنال های مغزی آغشته به آرتیفکت، آرتیفکت ها به صورت مولفه های مستقلی استخراج می شوند. تشخیص خودکار مولفه های مستقل مرب...
full textاستخراج ویژگی زمانی- فرکانسی جهت شناسایی دیداری مصوت های فارسی
در این پایان نامه روشی برای شناسایی مصوت های فارسی در کلمات تک سیلابی ارائه می شود. برای این منظور پس از جداسازی فریم های تصویر و انتخاب فریم هایی که مربوط به تلفظ مصوت موجود در کلمه تک سیلابی بودند و نیز استخراج ناحیه ای پیرامون لب ها، ویژگی های مختلفی همچون ضرایب کسینوسی و ضرایب موجک و ضرایب mfcc برای تشخیص مصوت ها در کلمات تک سیلابی استخراج گردید. پس از آن توسط روش کاهش ویژگی lsda، ویژگی ها ...
بهبود آشکارسازی مؤلفة P300 با استفاده از تلفیق روشهای مختلف زمانی، فرکانسی و مکانیِ استخراج ویژگی
دراین مقاله سیستمی مبتنی بر بازشناسی آماری الگو جهت تفکیک سیگنالهای حاوی P300 و فاقد آن، ارائه میشود. این سیستم- که بر روی دادگان P300-Speller مسابقات BCI 2005 کار میکند- از چهار بخش اصلی پیشپردازش، استخراج ویژگی، انتخاب ویژگی و طبقهبند تشکیل شده که تأکید اصلی این مقاله بر بخش استخراج ویژگی و بررسی کارایی ویژگیهای مختلف است. در مرحلة استخراج ویژگی، شش دسته ویژگی شامل قطعهبندی هوشمند، ضرا...
full textتشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...
full textبهبود کیفیت گفتار مبتنی بر بهینهسازی ازدحام ذرات با استفاده از ویژگی های ماسک گذاری سیستم شنوائی انسان
چکیده: در این مقاله، روشهای دوکاناله جدید زیرفضایی سیگنال با استفاده از تکنیکهای حذف نویز ادراکی برای بهبود کیفیت سیگنال گفتار پیشنهاد شدهاند. روشهای پیشنهادی از مشخصات ماسکگذاری سیستم شنوایی انسان برای کاهش نویز باقیمانده قابلشنیدن بهره میگیرند. روش تجزیه به مقادیر منفرد کسری ادراکی، تکنیک بهینهسازی ذرات را برای تخمین نویز جمعی استفاده میکند. نتایج شبیهسازی دقیقی که توسط دو معیار مخ...
full textاستخراج ویژگی های مقاوم از سیگنال گفتار
در این پایاننامه دو روش استخراج ویژگی جدید که برای بازشناسی گفتار مفید است، ارائه شده است. ایده اصلی این پایاننامه، ارائه یک ساختار منعطف برای بانک فیلتر میباشد که به دادههای آموزشی وابسته است. درحالیکه سایر روشهای استخراج ویژگی نظیر mfcc، ساختار بانک فیلتر ثابت و غیرمنعطفی را ارائه میدهند. برای پیادهسازی هر دو ایده، ابتدا، تعدادی فیلتر یکسان در نظر گرفته میشود. سپس، در روش اول، برمبنا...
My Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023